(19)日本因特許庁(JP)

(12) 公開特許公報(A)

(11)特許出版公明番号

:0462763572

# 特開平5-151064

(43)公開日 平成5年(1993)6月18日

| (51)IntCL <sup>5</sup> |      | 識別記号  | 厅内整理番号  | FI | 技術表示值所 |
|------------------------|------|-------|---------|----|--------|
| G06F 1                 | 2/02 | 510   | 8841-5B |    |        |
|                        | 9/46 | 360 B | 8120-5B |    |        |
| 1                      | 5/16 | 430   | 9190-5L |    |        |

# 審査商求 未請求 請求項の数1(全 5 頁)

|          |                  |          | <del></del>                                |
|----------|------------------|----------|--------------------------------------------|
| (21)出取番号 | 特顯平3-316329      | (71)出版人  | 000008507<br>横河取豫珠式会社                      |
| (22)出題日  | 平成3年(1991)11月29日 |          | 東京都武武野市中町 2丁目 9番32号                        |
|          | •                | (72) 堯明老 | · 和田 英彦<br>東京都武政野市中町2丁目9新32号 梭河<br>電機株式会社内 |
|          |                  | (74)代理人  | 弁理士 小沢 信助                                  |
|          |                  |          |                                            |
|          |                  |          |                                            |
|          |                  |          |                                            |
|          |                  |          |                                            |
|          |                  |          |                                            |
|          |                  |          |                                            |
|          |                  | 1        |                                            |

# (54)【発明の名称】 密結合マルチプロセツサシステム

## (57) 【英約】

【目的】マルチプロセッサシステムにおいてスレッドの プロセッサへのスケジューリングを行なう際、キャッシュメモリによる効果を考慮した割り当てを行なうことに よってシステムパスのトラフィックを軽減し、さらにシステム全体の性能の向上を図る。

【構成】 密結合マルチプロセッサシステムにおいて、共有メモリに、実行スレッドの記憶、並びに割り当て可能プロセッサ集合、実行可能スレッド集合、タスク集合、実行スレッド集合および実行中断スレッド集合のそれぞれを記憶し、他方複数のプロセッサの内のいずれか一つのプロセッサに、実行スレッドの実行履歴と、割り当て可能プロセッサ集合、実行可能スレッド集合、タスク集合、実行スレッド集合および実行中断スレッド集合からスレッドとタスクの関係を参照し、プロセッサのスレッドの割り当てを行うスケジューラを備える。



-1-

(2)

特闘平5-151064

【特許請求の範囲】

【請求項1】 共有メモリと、キャッシュメモリをそれぞ れ有する複数のプロセッサがシステムパスを介して相互 に接続された構成で成る密結合マルチプロセッサシステ ムにおいて、

**前記共有メモリに、実行スレッドの記憶、並びに割り当** て可能プロセッサ集合、実行可能スレッド集合、タスク 集合、実行スレット集合および実行中断スレッド集合の それぞれを記憶し、

前記複数のプロセッサの内のいずれか一つのプロセッサ 10 に、前記実行スレッドの実行履歴と、割り当て可能プロ セッサ集合、実行可能スレッド集合、クスク集合、実行 スレッド集合および実行中断スレッド集合からスレッド とタスクの関係を参照し、プロセッサのスレッドの割り 当てを行うスケジューラを備え、

システムバスのトラフィックを軽減させるようにしたこ とを特徴とする密點合マルチプロセッサシステム。

【発明の詳細な説明】

[0001]

【産祭上の利用分野】本発明は、各プロセッサがキャッ 20 シュメモリを有する密結合マルチプロセッサシステムに 関し、詳しくはスレッドのスケジューリング方式に関す ろものである。

[0002]

【従来の技術】従來より、システムバスに接続された共 有メモリと複数個のプロセッサから構成される密結合マ ルチプロセッサシステムがある。図3はこの私のマルチ プロセッサシステムの一例を示す要部構成図である。各 プロセッサ10、20、30は、マイクロプロセッサユ ニットMPUとキャッシュメモリCMから構成される。 なお、プロセッサMPUはそれぞれ浮動小数点演算ユニ ットFPU等の専用プロセッサを持っている場合があ る。そしてこれら各プロセッサはシステムパス40を介 して共有メモリ50と接続されている。

【0003】なお、ここで、本発明で使用するタスクと スレッドという用語について定義しておく。タスクと は、実際に計算を行なうために必要なシステムや計算機 の資源を管理する単位であり、アドレス空間の単位を指 す。また、スレッドとは計算実行の単位であり、CPU 資源の初当の単位をいう。この定義に従えば、スレッド 40 中断スレッド集合からスレッドとタスクの関係を参照 はタスク単位で管理される環境の中で実行されるという ことになる。また、最近の計算モデルでは一つのタスク の中に複数のスレッドが存在するマルチスレッドのモデ ルが提案されており、そのようなマルチスレッドの考え 方はマルチプロセッサシステムとの規和性がよいという 点で高く評価されている。

【0004】さて、このようなパス結合によるメモリ共 有型のマルチプロセッサシステムでは、結合するプロセ ッサ数が増加すると、プロセッサを結合しているシステ

アクセスに関してプロセッサ間の配合が発生する。プロ セッサ間の競合が発生すると待ち時間が長くなり、シス テム全体の性能は低下することになる。 システムパス4 0のトラフィックを減少させることができればプロセッ サ台数を増やしシステム全体の性能を向上させることが できる。しかし、プロセッサ台数を増やすとやはりシス テムパス40のトラフィックが増加し、そのため競合の 発生も多くなってしまう。 システムパスのトラフィック を減少させろには、図3に示すように各プロセッサにキ ャッシュメモリを付加する方式が有効である。

[0005]

【発明が解決しようとする課題】しかしながら従来のス ケジューリング方式、すなわち実行途中で中断されたス レッドを再開する時にはそのスレッドを実行可能である 任意のプロセッサに割り当てるという方式においては、 ハードウェア的に有効であるキャッシュメモリを十分に 利用していないという問題がある。つまりキャッシュの 効果を考慮に入れてスケジューリングを行なっているわ。 けではないということである。また従来の方式は新しい プログラミングモデルであるマルチスレッドに関しても **考慮していないという問題がある。** 

【0006】本発明の目的は、このような点に鑑みてな されたもので、マルチプロセッサシステムにおいてスレ ッドのプロセッサへのスケジューリングを行なう際、キ ャッシュメモリによる効果を考慮した割り当てを行なう ことによってシステムパスのトラフィックを軽減し、さ ちにシステム全体の性能を向上することのできるスケジ ューリング方式を採用した密結合マルチプロセッサシス アムを提供することにある。

30 [0007]

> 【疎磨を解決するための手段】このような目的を達成す るために本発明では、密結合マルチプロセッサシステム において、前記共有メモリに、実行スレッドの記憶、並 びに割り当て可能プロセッサ集合、実行可能スレッド集 合、タスク集合、実行スレッド集合および実行中断スレ ッド集合のそれぞれを記憶し、前記複数のプロセッサの 内のいずれか一つのプロセッサに、前記実行スレッドの 実行履歴と、割り当て可能プロセッサ集合、実行可能ス レッド集合、タスク集合、実行スレッド集合および実行 し、プロセッサのスレッドの割り当てを行うスケジュー ラを備えるようにした。

[8000]

【作用】本発明では、スレッドのプロセッサへのスケジ ューリングの際、キャッシュメモリによる効果を考慮し た割り当てを行う。すなわち、処理を再開するスレッド として、そのスレッドが以前切り当てられたプロセッサ に優先的に割り当てるようにする。その割り当てが不可 能な場合には、同じタスクに属する別のスレッドが割り ムパス40のトラフィックが増加する。そのためメモリ 50 当てられていたプロセッサに割り当てるようにする。同

AUG 15 '01 02:32 PAGE, 09

(3)

特開平5-151064

ータスク内では論理空間が共有されているので、同一タ スク内の別のスレッドが使用したキャッシュデータの再 利用の可能性は高い。これにより、システムパスのトラ フィックを軽減させることができる。

#### [0009]

01-8-15:14:42 : 日本IBM(株) 知所有権

【実施例】以下本発明を詳細に説明する。 キャッシュメ モリを有するシステムにおいて、実行を再開するスレッ ドが中断前とは別のプロセッサに初り当てられた場合、 共有メモリからキャッシュミスしたデータを転送すると いう動作が必ず必要となり、そのためにシステムバスの 10 なわれる。 トラフィックが増加することになる。一方実行を再開す るスレッドが、中断前に実行していたプロセッサに初り 当てられた場合、キャッシュメモリ内に中断前に使用し ていたデータが残っていれば、キャッシュメモリ内のデ ータをそのまま利用することによりプログラムの実行ス ピードは向上する。さらに共有メモリからのデータ転送 が不必要となり、そのためシステムパスのトラフィック は減少することになる。

【0010】このことから、本発明では、処理を再開す るスレッドを、そのスレッドが以前割り当てられたブロ 20 していない場合はOの処理に灰る。 セッサに優先的に割り当てるようにする。また、その割 り当てができない場合には、同じタスクに属する別のス レッドが割り当てられていたプロセッサに割り当てるよ うにする。なお、同一タスク内では論理空間を共有して いるので、同一タスク内の別のスレッドが使用したキャ ッシュデータを再利用できる可能性が高い。このような 方式を採れば、以前キャッシュメモリ内に転送したデー **タを有効に再利用できることは明らかである。このよう** なスケジューリング方式を実現するためには、上記のよ うなスケジューリングアルゴリズムを実装したスケジュ 30 ーラと、各プロセッサで実行したスレッド等をそれぞれ 記憶するメモリが必要である。

【0011】図1はこれを実現するためのブロック構成 図である。図において、1は各プロセッサで実行したス レッドを記憶する実行スレッド記憶メモリであり、各プ ロセッサごとにそのプロセッサで以前実行されたスレッ ド帝号(1つのスレッドごとに付けられるユニークな番 号)をn個分記憶する。nはタスクやスレッドの特性に よって変更することができる。 2 ないし6 もメモリであ り、2は例り当て可能プロセッサ集合、3は実行可能ス 40 レッド集合、4はタスク集合、5は実行スレッド集合、 6は実行中断スレッド集合をそれぞれ記憶するメモリで ある。7はスケジューラである。そして、実級の矢印は スレッドが矢印で示されるタスクに属することを示し、 磁線の矢印はプロセッサが過去に実行していたスレッド を記憶するメモリへの参照関係を示す。

【0012】なお、メモリ1ないし6は図3の構成にお いては共有メモリ50に在り、スケジューラ7は図3の 構成においてはいずれかのプロセッサに設けられる。ス ケジューラ7は、プロセッサにスレッドの割り当てを行 50 ステムにおけるスケジューリング機能部分のブロック構

なう場合、実行スレッド記憶メモリ 1 にある過去のスレ ッドの実行履歴と、割り当て可能プロセッサ集合2ない。 し実行中断スレッド集合6にあるスレッドとタスクの関 係を参照しながらスケジューリングを行なう。

【0013】このような構成における動作を図2の動作 フローを参照して次に説明する。図2はある時点で割り 当て可能であるプロセッサのスケジューリングに関する 動作フローである。あるプロセッサ(このプロセッサを Pとする)が空きになると以下の手順に従って処理が行

①実行可能集合3の中からスレッド (このスレッドを5) とする)を深択する。

②割り当て可能プロセッサ集合2と実行スレッド記憶メ モリ1を参照して前記選択スレッドSが以前プロセッサ Pで実行されていたかどうかを判定する。実行されてい ない場合は次の団に移り、実行されていた場合は団に移 行する。

③スレッドSの中断時間がT1を越しているかどうかを 判定する。越している場合は次の処理のに移行する。越

④実行スレッド記憶メモリ1と割り当て可能プロセッサ 集合2を参照して求めたスレッドがプロセッサPで以前 実行されたスレッドかどうかを、タスク集合4、実行ス レッド集合5、実行中断スレッド集合6を参照して同一 タスクに属するかどうかを判定する。属しない場合は次 の⑤の処理に移行する。届する場合は⑥の処理に移行す

⑤スレッド5の中断時間が丁2を越しているかどうかを 判定する。越していない場合はOの処型に戻る。越して いる場合は⑥の処理に移行する。

⑥スレッドSをプロセッサPで実行する。

【0014】なお、上記T1、T2はスレッドSをプロ セッサPで実行して、システムパスのトラフィックを軽 減するのに有効な時間を表わし、キャッシュメモリの杯 成やタスク・スレッドの特性によって変化する。T1は 1つのスレッドを同じプロセッサで実行する場合の時間 を示し、T2は1つのスレッドを同じタスク内の別のス レッドが実行したプロセッサで実行する場合の時間であ る。

### [0015]

【発明の効果】以上説明したように、本発明によれば、 キャッシュメモリの効果をスケジューリングに反映する ことによりシステムパスのトラフィックを軽減させ、さ らにシステム全体の性能を向上させることができる。特 にキャッシュメモリの容量が大きくなるほど、またプロ セッサ台数が多くなりシステムバスのトラフィックが大 さい場合ほど、その効果は著しい。

#### 【図面の簡単な説明】

【図1】本発明に係る共有メモリ型マルチプロセッサシ

-3-

AUG 15 '01 02:34 PAGE. 10



(4)

特開平5-151064

成図である。

【図2】 動作を説明するための動作フローである。

【図3】共有メモリ型マルチプロセッサシステムの一例 を示す概念的構成図である。

【符号の説明】

1 実行スレッド記憶メモリ

[21]



2 割り当て可能プロセッサ集合

3 実行可能スレッド集合

4 タスク集合

5 実行スレッド集合

6 実行中断スレッド集合

7 スケジューラ

图2】



# 12/ 12

01-8-15;14:42 :日本18M(株) 知所有権

(5) ·

特開平5-151064



-5-

AUG 15 '01 02:34 PAGE.12